Estimación de cambios en el número reproductivo efectivo \(R_t\)

  • Datos a partir de los reportes del Ministerio de Salud

El valor de \(R_t\) representa el número esperado de casos secundarios que surgen de un caso primario infectado en el momento \(t\). Este valor cambia a lo largo de un brote. Si el valor de \(R_t\) permanece por debajo de uno, el brote se extinguirá. Sin embargo, cuando \(R_t\) es mayor que uno, es probable que se produzca un brote sostenido. El objetivo de las intervenciones de control es típicamente reducir el número de reproducción por debajo de uno (Thompson et al. 2019).

Método de estimación aplicado (A. Cori et al. 2013; Thompson et al. 2019) permite la inclusión de los casos importados y que se puede estimar el intervalo serial a partir de seguimiento de casos y también incluir variablidad en la distribucion del intervalo serial cuando se asume una distribución gamma discreta.

  • Un parametro importante es el ‘Serial interval’ (SI). El SI es el tiempo entre el inicio de los síntomas de cada caso de la enfermedad en cuestión, y el inicio de los síntomas en cualquier caso secundario que resulte de la transmisión de los casos primarios. En otras palabras, es el tiempo entre casos en la cadena (de ramificación) de transmisión de la enfermedad. El SI es, de hecho, una distribución estadística de tiempos de intervalo en serie, en lugar de un valor fijo. Esa distribución se puede simular, generalmente utilizando una distribución gamma discreta con una media y desviación estándar dada.

  • Se utilizó un ‘Serial interval’ (SI) estimado por Q. Li et al. (2020) basado en 16 casos es de 7.5 días, con una SD=3.4, pero se permitió que la media del SI variara entre 2.3 y 8.4 usando una distribución normal truncada con una SD de 2.0, y tambien variamos la SD de la SD que variara entre 0.5 y 4.0

  • Luego se estimó el intervalo serial basandose en los datos de He et al. (2020) (77 casos), con una media estimada en su paper de 5.8 días, aunque esta dentro de los parámetros del punto anterior estos datos serían más realistas.

Variación en el intervalo serial

  • Usamos los datos de He et al. (2020) (77 casos) para estimar el intervalo serial (SI media de 5.8) y el \(R_t\), hay que eliminar el par con ID=9 porque el infector y el infectado suceden el mismo día. Estos datos consisten en la fecha de inicio de los síntomas en casos primarios y la fecha de inicio de síntomas en casos secundarios (originados por los primarios)

La mediana del intervalo serial estimado es mu =6.6944741 y la desviación sigma =4.4140809, lo cual es diferente de lo reportado en el paper de He et al. (2020) seguramente debido a que se usaron diferentes métodos. De ahora en adelante usaremos el intervalo serial estimado por nosotros.

Estimaciones usando modelos log-lineales

La fase inicial de un brote, cuando se muestra en un gráfico de semi-log (el eje y con una transformación logarítmica), aparece (algo) lineal. Esto sugiere que podemos modelar el crecimiento y decaimiento epidémico, utilizando un modelo log-lineal simple de la forma:

\[log(y) = rt + b\]

donde \(y\) es la incidencia, \(r\) es la tasa de crecimiento, \(t\) es el número de días desde un punto específico en el tiempo (generalmente el inicio del brote) y \(b\) es la ordenada de origen. Se ajustan modelos separados para distintas fases de la curva de epidemia (datos de incidencia).

  • Dividimos la curva de incidencia en dos partes, antes y despues del primer pico de incidencia que sucedió despues de la cuarentena (20/03/2020), que resultó el 30/03/2020. Tomamos esta fecha para determinar el \(R_0\) antes de la cuarentena

Estimamos con los casos locales (no importados) para toda Argentina

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.25 (95% CI 0.20 - 0.31)

  • La tasa de crecimiento después el pico fue 0.045 (95% CI 0.0474 - 0.043).

  • El tiempo de duplicacion de la primer parte es es 2.8 días (95% CI 2.3 - 3.5 días)

  • El tiempo de duplicación de la segunda parte 15.3 días (95% CI 14.6 - 16.1 días).

Proyecciones de incidencia para el total de casos Argentina

  • Esta estimación de proyecciones requiere la estimación del R0 para las dos fases que definimos (con division en el primer pico después de la cuarentena 2020-03-30), basado en (Nouvellet et al. 2018). Tomamos solamente los casos locales.

  • Utilizamos los datos sobre la incidencia diaria, el intervalo de serial (tiempo entre el inicio de los infectores y los infectados) y el número de reproductivo, que se mantiene constante, para simular trayectorias de epidemia plausibles y proyectar la incidencia futura. Se basa en un proceso de ramificación donde la incidencia diaria sigue un proceso de Poisson determinado por una infecciosidad diaria, calculada como:

\[\lambda_t \sim Pois \left ( \sum_{s=1}^{t-1} y_s w(t-s) \right ) \]

donde \(w()\) es la función de masa de probabilidad del intervalo serial, y \(y_s\) es la incidencia en el tiempo \(s\).

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.174   2.922   3.129   3.118   3.320   4.053

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.279   1.294   1.299   1.299   1.304   1.316

El \(R_0\) y la heterogeneidad de la epidemia

Habiendo hecho todos los calculos anteriores tenemos que aclarar que los análisis basados en el \(R_0\) (el número de reproducción básico, el número esperado de casos secundarios producida por un caso primario durante su período infeccioso en una población completamente susceptible (Kermack, McKendrick, and Walker 1927)) tienen una serie de susposiciones que no se cumplen (Hébert-Dufresne et al. 2020).Esto se puede razonar de la siguiente forma, el \(R_0\) nos dice el número de infecciones producidas por un caso pero ese numero promedio tiene una gran variación (Lloyd-Smith et al. 2005). Hay situaciones en las que se producen los eventos de super-propagación que están relacionadas con individuos que tienen mayor carga viral, o mayores contactos, o situaciones en las que se propicia la transmición (encuentros de muchas personas sin distancimiento ni protección). Es decir, puede ser engañoso mirar promedios provinciales o nacionales y celebrar si \(R_0\) parece estar cayendo por debajo de 1 porque la epidemia podría estar causando estragos en lugares deteminados o entre grupos particulares. Digamos que incluso si \(R_0\) está por debajo de 1 se pueden producir brotes grandes debido a la super-propagación o simplemente por casualidad.

Estimación de \(R_t\) y tiempo de duplicación para Ciudad de Buenos Aires CABA

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.14 (95% CI 0.10 - 0.18)

  • La tasa de crecimiento después el pico fue 0.04 (95% CI 0.0421 - 0.037).

  • El tiempo de duplicación de la primer parte es es 5.0 días (95% CI 3.9 - 6.8 días)

  • El tiempo de duplicación de la segunda parte 17.5 días (95% CI 16.5 - 18.8 días).

Proyecciones de Incidencia para CABA

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.534   1.937   2.055   2.046   2.148   2.530

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.243   1.253   1.261   1.260   1.265   1.278

Estimación de \(R_t\) y tiempo de duplicación para Ciudad de Buenos Aires CABA a partir de Datos Abiertos

Número total de casos al 2020-08-02 = 61630

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.14 (95% CI 0.11 - 0.18)

  • La tasa de crecimiento después el pico fue 0.039 (95% CI 0.0422 - 0.0366).

  • El tiempo de duplicación de la primer parte es es 4.9 días (95% CI 4.0 - 6.3 días)

  • El tiempo de duplicación de la segunda parte 17.6 días (95% CI 16.4 - 18.9 días).

Estimación de \(R_t\) y tiempo de duplicación para Prov. de Buenos Aires

  • Utilizamos los reportes del Ministerio de Salud. La linea punteada marron vertical es el primer pico de casos local para separar la 1ra fase, de 2da fase. Las lineas rojas es el inicio de la quarentena y las fases del gobierno nacional.

  • Luego estimamos modelos log-lineales

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.15 (95% CI 0.093 - 0.21)

  • La tasa de crecimiento después el pico fue 0.047 (95% CI 0.049 - 0.0456).

  • El tiempo de duplicación de la primer parte es es 4.6 días (95% CI 3.3 - 7.5 días)

  • El tiempo de duplicación de la segunda parte 14.7 días (95% CI 14.1 - 15.2 días).

Calculo de Proyecciones de Incidencia para Prov. De Buenos Aires

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.616   1.991   2.132   2.144   2.312   2.712

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.295   1.310   1.314   1.314   1.318   1.330

Estimación de \(R_t\) por provincia

  • Utilizamos los datos abiertos del Ministerio de Salud. Las lineas rojas son el inicio de la quarentena y las fases del gobierno nacional.

Chaco: Gran resistencia

fallecido fecha n porMillon
NO 2020-08-01 2917 7463
SI 2020-07-26 120 307

Comparación de datos de Incidencia (nro. de casos por día) por Provincia

  • Inicialmente utilizamos los datos abiertos del Ministerio de Salud. Las lineas rojas son el inicio de la quarentena y las fases del gobierno nacional.

  • Los datos cargados a partir de los reportes del Ministerio de Salud, tienen diferencias con los “Datos abiertos del Ministerio de Salud” en este último caso utilizamos las fechas de diagnóstico y la provincia de residencia, cuando lar provincia de residencia está SIN ESPECIFICAR se toma la provincia de carga.

residencia_provincia_nombre fecha Abiertos Reportes
Buenos Aires 2020-08-01 121683 118159
CABA 2020-08-01 61326 60676
Chaco 2020-08-01 3663 3638
Chubut 2020-08-01 287 285
Jujuy 2020-08-01 2379 2341
Neuquén 2020-08-01 1200 1195
Río Negro 2020-08-01 2060 2007

Parámetros a partir de Datos Abiertos por Provincia

  • Arreglo provicia de residencia SIN ESPECIFICAR asumiendo provincia de carga
  • Fallecidos sin fecha de hospitalización asumo que fueron hospitalizados.
  • Calculo de días de hospitalización solamente para los fallecidos.
  • Dias pre-hospitalización: desde inicio de síntomas hasta hospitalización.
Tabla 1: Fallecidos sin hospitalización con respecto a Casos, nro de días con respecto a inicio de síntomas
hospitalizado residencia_provincia_nombre edad dias_fallecimiento n Porcentaje
FALSE Buenos Aires 77.0 9.0 days 508 0.47
FALSE CABA 80.0 12.0 days 184 0.37
FALSE Jujuy 58.0 12.0 days 27 1.14
FALSE Río Negro 75.0 9.5 days 27 1.97
FALSE Córdoba 72.5 14.0 days 14 0.61
FALSE Chaco 71.0 7.0 days 11 0.34
FALSE La Rioja 79.0 9.0 days 10 3.12
FALSE Mendoza 85.0 5.0 days 7 0.86
FALSE Chubut 45.0 19.0 days 1 0.37
FALSE Entre Ríos 77.0 11.0 days 1 0.15
FALSE Neuquén 62.0 19.0 days 1 0.27
FALSE Tierra del Fuego 40.0 14.0 days 1 0.17
Tabla 2: TOTAL: Fallecidos sin fecha de hospitalización con respecto a Casos, nro de días con respecto a inicio de síntomas
fallecido edad dias_fallecimiento n Porcentaje
SI 77 10 days 792 0.46
Tabla 3: Proporcion Fallecidos con respecto a hospitalizados
residencia_provincia_nombre edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
Buenos Aires 73.0 8.0 days 2.0 days 1477 10.86
CABA 78.0 9.0 days 2.0 days 1066 8.66
Chaco 68.0 6.5 days 5.0 days 132 33.17
Río Negro 74.0 8.0 days 1.0 days 44 6.36
Córdoba 83.0 12.0 days 3.0 days 35 22.73
Mendoza 75.0 6.5 days 4.0 days 30 5.21
Neuquén 72.5 9.0 days 2.0 days 22 2.63
Santa Fe 69.0 7.0 days 3.0 days 15 10.42
La Rioja 66.5 12.0 days 2.5 days 8 29.63
Entre Ríos 78.0 6.0 days 2.0 days 7 3.85
Tucumán 63.5 9.0 days 3.0 days 5 14.29
Jujuy 61.0 3.0 days 5.0 days 4 25.00
Santa Cruz 65.0 7.0 days 6.0 days 3 8.11
Chubut 77.0 14.5 days 7.0 days 2 14.29
Misiones 54.5 4.5 days 2.0 days 2 6.67
Salta 75.5 2.0 days 0.5 days 2 2.06
Corrientes 70.0 8.0 days 4.0 days 1 20.00
Tierra del Fuego 79.0 23.0 days 1.0 days 1 9.09
Tabla 4: TOTAL: Proporcion Fallecidos con respecto a hospitalizados
fallecido edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO 44 NA 3 days 26334 90.22
SI 75 8 days 2 days 2856 9.78
Tabla 5: Proporción Hospitalizados con respecto a casos
residencia_provincia_nombre edad n Porcentaje
Buenos Aires 49.0 13598 11.15
CABA 47.0 12315 19.98
Neuquén 36.0 836 69.49
Río Negro 41.0 692 33.54
Mendoza 35.0 576 41.32
Chaco 58.0 398 10.84
Entre Ríos 44.5 182 21.49
Córdoba 70.0 154 6.33
Santa Fe 60.0 144 10.50
Salta 40.0 97 32.88
Santa Cruz 49.0 37 7.06
Tucumán 33.0 35 13.51
Misiones 52.5 30 53.57
La Rioja 57.0 27 7.76
Jujuy 53.0 16 0.67
Chubut 63.5 14 4.88
Tierra del Fuego 55.0 11 1.87
San Luis 44.0 10 35.71
La Pampa 54.5 6 3.92
Corrientes 47.0 5 2.54
San Juan 44.0 5 25.00
Santiago del Estero 24.5 2 4.17
Tabla 6: TOTAL Proporción Hospitalizados con respecto a casos
edad n Porcentaje
47 29190 14.46
Tabla 7: Letalidad Proporción Fallecidos con respecto a casos
residencia_provincia_nombre n Porcentaje
Buenos Aires 1985 1.63
CABA 1250 2.03
Chaco 143 3.90
Río Negro 71 3.44
Córdoba 49 2.01
Mendoza 37 2.65
Jujuy 31 1.30
Neuquén 23 1.91
La Rioja 18 5.17
Santa Fe 15 1.09
Entre Ríos 8 0.94
Tucumán 5 1.93
Chubut 3 1.05
Santa Cruz 3 0.57
Misiones 2 3.57
Salta 2 0.68
Tierra del Fuego 2 0.34
Corrientes 1 0.51
Tabla 8: TOTAL Letalidad Proporción Fallecidos con respecto a casos
fallecido n Porcentaje
SI 3648 1.81
Tabla 9: TOTAL: Proporcion Cuidado Intensivo con respecto a hospitalizados
cuidado_intensivo edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO 45 7.5 days 2 days 25932 88.84
SI 64 9.0 days 3 days 3258 11.16
Tabla 10: TOTAL: De Hospitalizados cuantos Fallecen y fueron a Cuidado Intensivo, o no
fallecido cuidado_intensivo edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO NO 43 NA 3 days 24312 92.32
NO SI 60 NA 3 days 2022 7.68
SI NO 79 7.5 days 2 days 1620 56.72
SI SI 69 9.0 days 3 days 1236 43.28
Tabla 11: TOTAL: De Cuidado intensivo cuantos Fallecen
fallecido edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO 60 NA 3 days 2022 62.06
SI 69 9 days 3 days 1236 37.94

Bibliografía

Cori, Anne, Neil M. Ferguson, Christophe Fraser, and Simon Cauchemez. 2013. “A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics.” American Journal of Epidemiology 178 (9): 1505–12. doi:10.1093/aje/kwt133.

He, Xi, Eric H. Y. Lau, Peng Wu, Xilong Deng, Jian Wang, Xinxin Hao, Yiu Chung Lau, et al. 2020. “Temporal Dynamics in Viral Shedding and Transmissibility of COVID-19.” Nature Medicine, April. Nature Publishing Group, 1–4. doi:10.1038/s41591-020-0869-5.

Hébert-Dufresne, Laurent, Benjamin M. Althouse, Samuel V. Scarpino, and Antoine Allard. 2020. “Beyond R0: Heterogeneity in Secondary Infections and Probabilistic Epidemic Forecasting,” April. http://arxiv.org/abs/2002.04004.

Kermack, William Ogilvy, A. G. McKendrick, and Gilbert Thomas Walker. 1927. “A Contribution to the Mathematical Theory of Epidemics.” Proceedings of the Royal Society of London. Series A, Containing Papers of a Mathematical and Physical Character 115 (772). Royal Society: 700–721. doi:10.1098/rspa.1927.0118.

Li, Qun, Xuhua Guan, Peng Wu, Xiaoye Wang, Lei Zhou, Yeqing Tong, Ruiqi Ren, et al. 2020. “Early Transmission Dynamics in Wuhan, China, of Novel Coronavirus–Infected Pneumonia.” New England Journal of Medicine 382 (13). Massachusetts Medical Society: 1199–1207. doi:10.1056/NEJMoa2001316.

Lloyd-Smith, J. O., S. J. Schreiber, P. E. Kopp, and W. M. Getz. 2005. “Superspreading and the Effect of Individual Variation on Disease Emergence.” Nature 438 (7066, 7066). Nature Publishing Group: 355–59. doi:10.1038/nature04153.

Nouvellet, Pierre, Anne Cori, Tini Garske, Isobel M. Blake, Ilaria Dorigatti, Wes Hinsley, Thibaut Jombart, et al. 2018. “A Simple Approach to Measure Transmissibility and Forecast Incidence.” Epidemics 22 (March): 29–35. doi:10.1016/j.epidem.2017.02.012.

Thompson, R. N., J. E. Stockwin, R. D. van Gaalen, J. A. Polonsky, Z. N. Kamvar, P. A. Demarsh, E. Dahlqwist, et al. 2019. “Improved Inference of Time-Varying Reproduction Numbers During Infectious Disease Outbreaks.” Epidemics 29 (December): 100356. doi:10.1016/j.epidem.2019.100356.